Rank in Wordlist | Frequency | Word |
---|---|---|
128 | 2887 | COVID-19 |
191 | 1958 | прэс-службе |
211 | 1794 | з-за |
974 | 471 | прэм'ер-міністр |
1060 | 438 | прэс-сакратар |
1196 | 393 | прэм'ер-міністра |
1371 | 341 | па-беларуску |
1694 | 285 | па-ранейшаму |
1712 | 283 | тэлеграм-канале |
2302 | 213 | З-за |
2413 | 205 | Прэм'ер-міністр |
2457 | 202 | прэс-служба |
2551 | 194 | віцэ-прэм'ер |
2615 | 191 | прэс-канферэнцыі |
2691 | 186 | інтэрнэт-партале |
2701 | 185 | прэс-цэнтры |
3226 | 155 | тэлеграм-канал |
3448 | 145 | Па-першае |
3601 | 140 | па-за |
3612 | 139 | 75-годдзя |
Rank in Wordlist | Frequency | Word |
---|---|---|
4143 | 121 | бел-чырвона-белы |
7832 | 61 | бел-чырвона-белыя |
8311 | 57 | SARS-CoV-2 |
9106 | 52 | бел-чырвона-белым |
11649 | 39 | бел-чырвона-белымі |
11856 | 38 | Бі-бі-сі |
13387 | 33 | бел-чырвона-белага |
15755 | 27 | відэа-канферэнц-сувязі |
22310 | 17 | бел-чырвона-белых |
25735 | 14 | бела-чырвона-белы |
Rank in Wordlist | Frequency | Word |
---|---|---|
50812 | 5 | АІ-92-К5-Еўра |
50813 | 5 | АІ-95-К5-Еўра |
50814 | 5 | АІ-98-К5-Еўра |
51898 | 5 | Нотр-Дам-дэ-Пары |
91606 | 2 | Мату-Гросу-ду-Сул |
92310 | 2 | Нове-Места-на-Мораве |
118040 | 1 | 04-Гам-КАВІД-Вак-2020-РБ |
118041 | 1 | 04-Гам-КОВІД-Вак-2020-РБ |
120289 | 1 | 20-х-30-х |
121408 | 1 | 30-40-50-гадовых |
Rank in Wordlist | Frequency | Word |
---|---|---|
118040 | 1 | 04-Гам-КАВІД-Вак-2020-РБ |
118041 | 1 | 04-Гам-КОВІД-Вак-2020-РБ |
146805 | 1 | Ну-у-у-у,фас-с-с-с |
174643 | 1 | гу-у-у-у-у |
194316 | 1 | не-а-па-зна-ва-ль-насць |
218834 | 1 | трактарам-водачкай-баняй-козачкамі- |
220071 | 1 | у-у-у-х-х-х |
Some languages allow the formation of longer word by composition using hyphens. Moreover, proper names may contain hyphens. Therefore we look for the most frequent words containing 1, 2, 3 or 4 hyphens.
Usually we find interesting words. But in the case of poor preprocessing there may be unexpected strings resulting from hyphenation etc. Words ending with an hyphen are usually not welcome, too.
For three hyphens:
select w_id-100,freq, word from words where word like "%-%-%-%" limit 10;
3.12.2 Multiwords
3.12.3 (Multi-)Words with dots
3.12.4 Words containing special characters